ارائه الگوریتمی مبتنی بر خوشه بندی مارکوف برای تشخیص روبات های وب

پایان نامه
چکیده

روبات ها یا خزنده های وب برنامه هایی برای استخراج دانش از صفحات وب هستند که کار خود را با تعدادی صفحه آغاز کرده و به صورت بازگشتی تمام اسناد قابل دسترسی از این صفحات را بازدید می کنند. روبات های وب با رفتار های متفاوت اعم از مخرب و غیر مخرب، در کنار کاربران انسانی، جزء بازدیدکنندگان وب به حساب می آیند. امروزه، با افزایش استفاده از اینترنت و پیدایش امکانات جدید در وب، نیاز به وجود روبات ها افزایش یافته است. تمایز انسان و روبات از حیث تامین امنیت شبکه های کامپیوتری، باعث طرح مساله تشخیص روبات وب شده است که حل دقیق آن، سایت ها را از دید روبات های مخرب مصون داشته و کارایی سرورها را با کاهش اولویت در پاسخ-دهی به روبات ها افزایش می دهد. در این مقاله می کوشیم؛ با ارائه 2 ویژگی جدید مبتنی بر الگوهای پیمایشی روبات-ها و منابع مورد درخواست آن ها، شباهت کسینوسی بین انسان و روبات را کاهش داده و با ارائه الگوریتمی مبتنی بر خوشه بندی مارکوف، بازدیدکنندگان دو وب سایت دانشگاهی و آموزشی را خوشه بندی نماییم. آزمایش ها نشان می دهد؛ آن چه بیشتر از تعداد ویژگی ها اهمیت دارد؛ مرتبط و مناسب بودن ویژگی های استفاده شده است. علاوه بر این، طبق ارزیابی های باناظر، الگوریتم پیشنهادی به طور متوسط با دقتی برابر 99.7? خوشه هایی تولید می کند که دارای آنتروپی 0.0215 بوده و 97.7? خالص هستند. همچنین متوسط 96.4? روبات ها به درستی تشخیص داده می-شوند. تحلیل نهایی خوشه ها نشان می دهد؛ برخی روبات های مفید اگرچه شناخته شده اند؛ می توانند با تقلید رفتار انسان شناسایی خود را دشوار سازند. علاوه براین، الگوریتم پیشنهادی از نقطه نظر کیفیت خوشه های نهایی و دقت، عملکردی بهتر نسبت به روش های مرز دانش دارد.

منابع مشابه

الگوریتمی جدید برای جزیره بندی کنترل شده سیستم های قدرت مبتنی بر خوشه بندی طیفی مقید

In this paper a new algorithm is presented for power systems controlled islanding based on constrained spectral clustering. The proposed algorithm minimizes two objective functions of power flow disruption in transmission lines and generation - demand imbalance in islands to ensure transient stability within islands and to minimize necessary actions in reconfiguration of transmission system, ge...

متن کامل

ارائه الگوریتمی تکاملی ترکیبی برای حل مسئله خوشه بندی

چکیده امروزه کاوش در اطلاعات و کشف دانش که یکی از ره آوردهای داده کاوی است در علوم مختلف استفاده می شود. خوشه بندی از مهمترین الگوریتم های داده کاوی است. الگوریتم خوشه بندی اطلاعاتی را که ویژگی های نزدیک به هم و مشابه دارند را در دسته های جداگانه که به آن خوشه گفته می شود قرار می دهد. از جمله کاربردهای آن می توان به مسئله کاهش رنگ تصویر اشاره کرد. این کار، به صورت سنتی، در هنر فرش بافی ایران ن...

یک مدل خوشه بندی مبتنی بر folding جهت خوشه بندی تصاویر وب

با رشد بی سابقه تولید تصاویر دیجیتال و استفاده از منابع چندرسانه ای مانند صوت، عکس و فیلم، نیاز به جستجوی تصاویر و مطالب افزایش یافته است. پردازش نظام مند این اطلاعات پیش نیازی اساسی برای تحلیل، سازمان دهی و مدیریت موثر آن محسوب می شود. از طرفی با توجه به پیشرفت سریع در سخت افزار و نرم افزار، وب جهان گستر به عنوان یک مکانیزم انتشار برخط، به یک منبع چندرسانه ای در حال رشد تبدیل شده است و مجموعه ...

15 صفحه اول

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

متن کامل

ارائه الگوریتمی جهت خوشه بندی سیگنال الکتروکاردیوگرام هولتر

به منظور یافتن روشی برای تشخیص بیماری های قلبی خوشه بندی صحیح سیگنال های الکتروکاردیوگرام امری حیاتی است. تمرکز اصلی این پایان نامه بر ارائه ی الگوریتمی با دقت بالا برای یافتن راه حلی برای خوشه بندی کمپلکس های سیگنال الکتروکاردیوگرام (ecg) هولتر است. در این پژوهش علاوه بر پایگاه داده mitbih از پایگاه داده ایجاد شده توسط گروه قلب دانشگاه خواجه نصیر نیز استفاده شده است. در مرحله اول، با استفاده...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه امام رضا علیه اسلام - دانشکده کامپیوتر و فناوری اطلاعات

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023